[Wiki] [一覧]

In-context Learning(文脈内学習)

概要

In-context Learning(ICL, 文脈内学習)は、大規模言語モデル がパラメータを更新することなく、プロンプト(コンテキスト)内に与えられた例から タスクを学習する能力です。GPT-3(Brown et al., 2020)で広く知られるようになり、Few-shot Learning の中核となるメカニズムです。

仕組み

  1. プロンプトに例を埋め込む — タスクの入出力例を数個提示する
  2. パターン認識 — モデルが例から規則性を推測する
  3. 生成 — 新しい入力に対して、推測した規則を適用する

ファインチューニング と異なり、モデルの重みは一切更新されません。学習は「推論時」にコンテキスト上で起こります。

なぜ可能か

これは「次の単語を予測する」という事前学習だけから立ち現れる 創発的能力 の代表例です。

ショット数による分類

名称例の数
Zero-shot0個(タスク説明のみ)
One-shot1個
Few-shot Learning数個〜数十個

関連・発展

頑健性:分布シフトへの対応

提示する例(デモンストレーション)の選び方は ICL の性能を大きく左右しますが、ターゲットドメインが未知・アクセス不能な実シナリオでは選択が難しくなります。

関連ページ

参考資料